标准差

Standard Deviation 方差的平方根;离散程度的同量纲度量

一、基本定义

标准差是方差的平方根,用来衡量随机变量或样本数据围绕均值的典型偏离程度。因为方差使用平方单位,标准差把量纲还原到原变量的单位,更便于解释。

若随机变量 X 的方差为 D(X)=σ2,则标准差为

σ=D(X)=E[(XE(X))2].

若样本方差为 S2,则样本标准差为

S=S2.

二、样本标准差

给定样本 x1,,xN,样本均值为

m=x1++xNN.

样本方差通常除以 N1

S2=1N1i=1N(xim)2,S=1N1i=1N(xim)2.

除以 N1 是因为样本均值 m 已经由同一批样本估计,少了一个自由度;在独立同分布抽样下,这样得到的 S2 是总体方差的无偏估计。

例如五个年龄样本为 18,17,18,19,17,样本均值是

m=18+17+18+19+175=17.8.

平方离差和为

(.2)2+(.8)2+(.2)2+(1.2)2+(.8)2=2.8.

因此

S2=2.84=0.7,S=0.7.

三、概率标准差

当随机变量 x 的取值 x1,,xn 及概率 p1,,pn 已知时,先计算期望

m=E[x]=p1x1++pnxn=px,

再计算方差和标准差:

σ2=i=1npi(xim)2,σ=σ2.

例如新生年龄为 17,18,19 的概率分别是 .2,.5,.3,则

m=(.2)17+(.5)18+(.3)19=18.1.

方差为

σ2=(.2)(1718.1)2+(.5)(1818.1)2+(.3)(1918.1)2=.49.

所以标准差为

σ=.49=.7.

这表示按概率加权后,年龄围绕期望 18.1 的典型偏离量约为 0.7 岁。

四、标准化

σ>0 时,可以把随机变量标准化:

X=Xμσ.

标准化先减去均值 μ,使中心移动到 0;再除以标准差 σ,使离散尺度变成 1。标准化后的变量满足

E(X)=0,D(X)=1.

在正态分布、中心极限定理和统计检验中,标准差常用来描述离均值几个标准差的位置。例如标准正态分布的均值为 0、标准差为 1

五、边界条件

六、相关概念